Règles d'association avec une prémisse composée : mesure du gain d'information
نویسندگان
چکیده
La communauté de fouille de données a développé un grand nombre d’indices permettant de mesurer la qualité des règles d’association (RA) selon diverses sémantiques (Guillet, 2004). Cependant ces sémantiques, qui permettent d’interpréter les règles simples, s’avèrent d’utilisation trop complexe pour un expert dans le cas de règles à prémisse composée. Notre objectif est donc de sélectionner les règles à prémisse composée de type AB→C qui apportent une information supplémentaire à celle des règles simples A→C et B→C. Pour cela nous définissons un indice de gain d’une règle composée par rapport aux règles simples. Dans l’application présentée, nous extrayons des RA de résultats de classifications pour en faciliter l’analyse . Le gain a permis de filtrer des règles d’interprétation simple.
منابع مشابه
Sous-bases k-faibles pour des règles d'association valides au sens de la confiance
L’un des problèmes majeurs rencontrés dans la fouille des règles d’association valides au sens de la confiance est le nombre souvent très élevé de ces règles. Plusieurs solutions à ce problème ont été proposées ou considérées dans la littérature. Parmi ces solutions figurent les bases, c’est-à-dire, des familles génératrices minimales (Zaki et Ogihara, 1998; Pasquier et al., 1999). La plupart d...
متن کاملRecherche de dépendances fonctionnelles et de règles d'association avec OLAP
Dans l’étude des bases de données, il est intéressant de déceler les liens entre les attributs. Pour ça, plusieurs outils sont disponibles. Les Règles d’Association (RA) permettent de savoir quelles valeurs des attributs dépendent d’autres valeurs. Les Dépendances Fonctionnelles (DF) permettent de savoir quels attributs dépendent des autres. Les RA donnent des informations à un niveau de granul...
متن کاملMesure formelle de la robustesse des règles d'association
Résumé. Nous proposons dans cet article une définition formelle de la robustesse pour les règles d’association, s’appuyant sur une modélisation que nous avons précédemment définie. Ce concept est à notre avis central dans l’évaluation des règles et n’a à ce jour été que très peu étudié de façon satisfaisante. Il est crucial car malgré une très bonne évaluation par une mesure de qualité, une règ...
متن کاملContrôle du risque multiple pour la sélection de règles d'association significatives
Résumé. Les algorithmes d'extraction de règles d'association parcourent e cacement le treillis des itemsets pour constituer une base de règles admissibles à des seuils de support et de con ance, mais donnent une multitude de règles peu exploitables. Nous suggérons d'épurer de telles bases en éliminant les règles non statistiquement signi catives. La multitude de tests pratiqués conduit mécaniqu...
متن کاملIPEE : Indice Probabiliste d'Ecart à l'Equilibre pour l'évaluation de la qualité des règles
Résumé. La mesure de la qualité des connaissances est une étape clef d’un processus de découverte de règles d’association. Dans cet article, nous présentons IPEE, un indice de qualité de règle qui a la particularité unique d’associer les deux caractéristiques suivantes : d’une part, il est fondé sur un modèle probabiliste, et d’autre part, il mesure un écart à l’équilibre (incertitude maximum d...
متن کامل